2014/03/02

[摘譯]科學家試圖尋找暢銷書的秘方

[原文]
Computer Algorithm Seeks To Crack Code Of Fiction Bestsellers | Inside Science

[摘譯]
英國的著名小說家,威廉·薩默塞特·毛姆,曾說,寫小說有三個原則。「但是不幸的,沒人知道那三個原則是什麼」。

三位電腦科學家,Vikas Ganjigunte Ashok,Song Feng,和 Yejin Choi,嘗試用演算法來解答這個問題。

他們從古騰堡計畫Project Gutenberg)收錄的 44,500 本開放版權的書開始,進行「計量文獻學」(stylometry)的分析,分析作品的寫作風格;再以「下載量」作為「受歡迎程度」的指標,比較「成功」與「不成功」的作品之間的差異。

然後,研究人員又加進了其他不在古騰堡計畫收錄範圍內的經典名作,像是「雙城記」(Charles Dickens)、「老人與海」(Ernest Hemingway),和達文西密碼作者 Dan Brown 的最新作品 The Lost Symbol,以及其他眾多得獎作品,進行相同的分析。

研究結果發現,「好」的作品,在「連接詞」和「介係詞」的使用上勝過較差的作品;同時,好的作品大量的使用名詞和形容詞,而較差的作品較傾向於仰賴動詞和副詞。

而在動詞的使用上,好作品較常用在「描述思考過程」,而其他作品較常用在描述動作或情感上。

研究人員解釋道:「這是『展示』和『關懷』的差異,若要真正引起讀者的共鳴,作者應該像記者一般,具體的描述人物的狀態和處境,而非直接了當的說『他非常非常的傷心』。」

這樣的研究成果對現實世界是不是有用呢?

出版商 Mitchell Hamilburg 覺得:「很有趣的點子,但是目前看來還不能取代我們日常工作的專業判斷。」

作家 Ron Hansen 則是表示支持,因為研究中發現的許多風格特徵,跟他在創意寫作課裡教授的內容非常一致。

[譯按]
1. 「計量文獻學」(stylometry)是一種關於「語言風格」的應用研究,除了寫作風格之外,也成功的應用在「音樂」跟「繪畫」上,常用來判斷作品的原作者是誰。這門學問是文學、藝術與機器學習的結合。

2. 這個研究是針對英文,所以一些關於字彙選擇的發現就沒有翻譯了。話說中文好像沒有人做這樣的分析,不過反正大家也都是看翻譯書,何必多此一舉? XD



沒有留言:

張貼留言